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Resumen 


El estudio de la seguridad hidrológica en los embalses se realiza con el 
llamado hidrograma de la creciente de diseño. El proceso más sencillo y 
aproximado para estimar tal gráfica se basa en el análisis de frecuencias 
bivariado (AFB) para definir su gasto máximo (Q) y volumen (V), 
asociados con el periodo de retorno conjunto de diseño. Las funciones 


Cópula (FC) se fundamentan en la dependencia entre Q y V, y definen la 
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distribución bivariada por medio de las funciones univariadas marginales 
previamente adoptadas. El enfoque práctico adoptado utiliza FC de un 
solo parámetro de ajuste y selecciona la más adecuada a partir de la 
dependencia que muestra el registro conjunto de Q y V en el extremo 
derecho de su distribución empírica. Además, contrasta y ratifica la FC 
adoptada contra varias de uso común en los AFB. Lo anterior, por medio 
de los errores de ajuste entre las probabilidades bivariadas empíricas y 
teóricas. La búsqueda de las distribuciones marginales se realizó con base 
en el diagrama de cocientes L para adoptar las tres mejores y 
confrontarlas con las funciones Kappa y Wakeby de gran versatilidad. Se 
realizó el AFB de las 55 crecientes anuales registradas en la estación 
hidrométrica La Cuña de la Región Hidrológica No. 12-3 (río Santiago), 
México. Se definen cuatro periodos de retorno conjuntos de diseño y se 
detalla el cálculo de sus curvas de tipo AND. Por último, se citan varias 
conclusiones que destacan las ventajas del uso de las FC en los AFB de 


crecientes. 


Palabras clave: familias de funciones Cópula, cociente tau de Kendall, 
coeficiente rho de Spearman, probabilidades empíricas conjuntas, 
dependencia en el extremo derecho, periodos de retorno conjuntos, 


eventos críticos. 


Abstract 


The study of hydrological safety in reservoirs is carried out with the so— 
called Design Flood Hydrograph. The simplest estimation of such a graph 
is based on the bivariate frequency analysis (BFA), by defining its 


maximum flow (Q) and volume (V), associated with a joint design return 
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period. The Copula functions (CF) are based on the dependence between 
Q and V, and define the bivariate distribution by means of the previously 
adopted marginal univariate functions. The practical approach adopted 
uses CF with a single fit parameter and selects the most appropriate, 
based on the dependence shown by the joint record of Q and V, at the 
far-right end of its empirical distribution. Moreover, the practical approach 
compares and ratifies the adopted CF, against several of common use in 
the BFA. The above, using the fitting errors between the empirical and 
theoretical bivariate probabilities. Due to their importance, the search for 
marginal distributions was carried out based on the L quotient diagram, 
adopting the best three and comparing them to the highly versatile Kappa 
and Wakeby functions. The BFA of the 55 annual floods registered in the 
La Cuña hydrometric station of the Hydrological Region No. 12-3 
(Santiago River), Mexico was carried out. Four joínt design return periods 
were defined and the calculation of their AND curves is detailed. Finally, 
several Conclusions are cited which highlight the advantages of the use 
of CF in flood BFAs. 


Keywords: Families of Copula functions, Kendall's tau quotient, 
Spearman's rho coefficient, joint empirical probabilities, right-tail 


dependency, joint return periods, critical events. 
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Introducción 


Generalidades 


En México, las inundaciones causadas por las crecientes son uno de los 
desastres naturales que más daños materiales, ambientales y sociales 
originan en los asentamientos humanos. Por ello, la reducción del riesgo 
mediante obras hidráulicas y la elaboración de los planes de mitigación 
de daños, sin tales estructuras, han llegado a ser vitales para la sociedad. 
La planeación y el diseño hidrológico de obras de protección, como diques 
y muros de contención, rectificaciones, canalizaciones, puentes y algunas 
obras del drenaje urbano, se dimensionan a partir de las llamadas 
crecientes de diseño (CD). Las CD son gastos máximos anuales del río 
donde se ubicará la obra hidráulica, asociadas con bajas probabilidades 
de ser excedidos (Aldama, Ramírez, Aparicio, Mejía-Zermeño, 8 Ortega- 
Gil, 2006; Rao € Hamed, 2000; Meylan, Favre, € Musy, 2012). 


La estimación más confiable de las CD se realiza a través del llamado 
análisis de frecuencias de crecientes (AFC) univariado, el cual intenta 
representar al registro de gastos máximos anuales del río con una función 
de distribución de probabilidades (FDP) o modelo probabilístico, con el 
cual se realizan las predicciones buscadas o CD. Los AFC conducen a 
resultados confiables cuando se cumplen varias condiciones, entre ellas, 
que el registro disponible de gastos sea aleatorio, que la FDP sea la más 
representativa de tales datos, y que su ajuste se realice con un método 
eficiente y robusto (Hosking 8 Wallis, 1997; Meylan et al., 2012; 
Stedinger, 2017). 
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Por otra parte, los embalses o almacenamientos se pueden clasificar 
de manera simple en grandes, medianos y pequeños. Los grandes 
embalses son de múltiples propósitos y operación multianual, englobando 
el aprovechamiento y la protección contra crecientes. En cambio, los 
embalses pequeños son de propósito único, por lo general el riego, y por 
ello guardan agua de la temporada de lluvias para utilizarla en el siguiente 
estiaje. Sean grandes, medianos o pequeños, el diseño de los embalses 
por seguridad hidrológica requiere la estimación del hidrograma de la CD 
(Aldama, 2000; Aldama et a/., 2006; Gómez, Aparicio, 8, Patiño, 2010). 


El hidrograma es la gráfica de evolución de la creciente con el tiempo 
en las abscisas y el gasto en las ordenadas. Entonces, el área que define 
es el volumen escurrido (V) y sus amplitudes en el tiempo la duración 
total (D) y en las ordenadas el gasto máximo (Q), cuyo lapso transcurrido 
desde el inicio se llama tiempo pico (tp). El hidrograma establece 
claramente que las crecientes son un fenómeno hidrológico multivariado, 
cuyos elementos están correlacionados (Favre, El Adlouni, Perreault, 
Thiémonge, 8: Bobée, 2004; Aldama et al., 2006; Gráler et a/., 2013; 
Chowdhary 8 Singh, 2019). 


Aldama (2000) demostró que los embalses no son sensibles al valor 
del tp, y como el Q y el V están correlacionados y el V lo está con D, el 
estudio multivariado de las crecientes se pudo reducir a un análisis 
bivariado de Q y V para definir de manera aproximada el hidrograma de 
la CD. El AFC bivariado comenzó a finales del siglo pasado con los trabajos 
de Goel, Seth y Chandra (1998), y de Yue, Ouarda, Bobée, Legendre y 
Bruneau (1999), que procesaron datos de Q y V de las crecientes anuales, 


los primeros con base en la distribución Normal bivariada, al igual que 
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Yue (1999), y los segundos aplicando el llamado modelo logístico (Yue 8 


Wang, 2004), con distribuciones marginales Gumbel. 


Los primeros AFC bivariados estuvieron limitados por la escasa 
disponibilidad de FDP multivariadas, cuyos primeros modelos utilizados 
fueron extensiones de las distribuciones univariadas, por ejemplo, las 
bivariadas Normal, Log-normal, Exponencial, Pareto y Gamma. Favre et 
al. (2004) indican que este tipo de distribuciones tiene las tres 
desventajas siguientes: (1) sus distribuciones marginales pertenecen a la 
misma familia; (2) la extensión más allá del caso bivariado no es simple 
o no existe, y (3) los parámetros de ajuste de tales marginales también 


se usan para modelar la dependencia entre las variables aleatorias Q y V. 


Las limitaciones y desventajas de las distribuciones bivariadas 
existentes son fácilmente eliminadas al aplicar las llamadas funciones 
Cópula (FC), las cuales permiten modelar la dependencia entre las 
variables Q y V, además de conjuntar cualquier tipo de distribución 
marginal univariada adoptada previamente para construir la nueva 
distribución bivariada (Shiau, Wang, 8: Tsai, 2006; Sraj, Bezak, € Brilly, 
2015; Genest 8: Chebana, 2017; Zhang € Singh, 2019). 


Las primeras aplicaciones prácticas de las FC lógicamente fueron 
bivariadas y comienzan con los trabajos de Favre et al. (2004), y 
Salvadori y De Michele (2004). Después se tienen los estudios de Zhang 
y Singh (2006), y de Genest y Favre (2007). De manera simultánea llegan 
las aplicaciones trivariadas con los análisis de Grimaldi y Serinaldi (2006), 
y de Zhang y Singh (2007). En la actualidad, las aplicaciones de las FC en 
los análisis de frecuencias de los diversos datos hidrológicos se han 


consolidado, como lo demuestran los textos de Salvadori, De Michele, 
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Kottegoda y Rosso (2007), Zhang y Singh (2019), Chen y Guo (2019), y 


los capítulos de Salvadori y De Michele (2013), y de Chowdhary y Singh 
(2019). 


En este estudio, con el enfoque práctico de las FC, se intenta una 
similitud operativa con los AFC univariados, al realizar los bivariados. Para 
lograr lo anterior, se utilizan FC de un solo parámetro de ajuste, que ya 
han sido probadas en los AFC bivariados y cuya selección se hace con 
base en indicadores de ajuste y no por medio de simulación aleatoria. 
Además, de inicio se define si la muestra disponible de datos conjuntos 
de Q y V muestra dependencia en la cola derecha de su distribución 
empírica y, de ser así, primero se buscan y después se prueban FC que 


muestren tal dependencia. 


Objetivos 


Los objetivos de este estudio son los siete siguientes: (1) enunciar de 
manera breve el concepto operativo de las FC; (2) exponer las FC de cada 
familia que han sido empleadas en los AFC; (3) describir el ajuste de la 
FC con base en las medidas de asociación; (4) explicar el concepto de 
dependencia en el extremo derecho tanto de forma empírica como teórica 
de cada FC expuesta; (5) seleccionar y probar las FC que son aplicables 
en el ejemplo numérico descrito; (6) estimar y contrastar los periodos de 
retorno univariados y los bivariados, y (7) realizar una aplicación 
numérica con los 55 gastos máximos y volúmenes de las crecientes 
anuales registradas en la estación hidrométrica La Cuña de la Región 
Hidrológica No. 12-3 (río Santiago), México. 
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Teoría operativa 


Las funciones Cópula 
Concepto y definición 


La característica esencial de las funciones Cópula (FC) consiste en permitir 
expresar una distribución conjunta de variables aleatorias correlacionadas 
como una función de sus distribuciones marginales. Entonces, una FC 
enlaza o relaciona las distribuciones marginales univariadas para formar 
una distribución multivariada. Una ventaja básica de las FC para formar 
distribuciones multivariadas es el hecho de que ellas separan el efecto de 
la dependencia entre las variables aleatorias de los efectos de las 


distribuciones marginales. 


Debido a lo anterior, la construcción de la distribución multivariada 
se reduce al estudio de la relación que guardan las variables dependientes 
cuando las distribuciones marginales univariadas son conocidas. En 
resumen, el uso de las FC ofrece entera libertad para adoptar o 
seleccionar los mejores modelos marginales univariados que representen 
a los datos (Shiau et a/., 2006; Kottegoda € Rosso, 2008; Meylan et al., 
2012; Zhang € Singh, 2019; Chen € Guo, 2019). 


Como en este estudio aplicarán las FC en el análisis de frecuencias 
bivariado de las crecientes anuales, la definición siguiente se refiere a dos 


variables aleatorias X y Y correlacionadas, cuya función de distribución de 
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probabilidades acumuladas conjuntas es Fxy(x, y) con distribuciones 
marginales univariadas Fx(x) y Fyr(y); entonces la función Cópula C existe 


y es tal que: 
Fx y (xy) = C[Fz Go), Fy ()] (1) 


La función Cópula C es única si las variables aleatorias X y Y son 
continuas; en otro caso está solo determinada en el producto del rango 
de X por el rango de Y. Además, una Cópula es una función de distribución 


bivariada con marginales uniformes en el intervalo (0, 1). 


La Ecuación (1) define el concepto básico para el desarrollo de las 
funciones Cópula y se conoce como Teorema de Sklar expuesto en 1959 
(Sklar, 1959; Shiau et al., 2006; Salvadori et al., 2007; Kottegoda 8 
Rosso, 2008; Meylan et a/., 2012; Chen € Guo, 2019; Zhang € Singh, 
2019). 


Familias de Cópulas 


Las funciones Cópula (FC) que han sido desarrolladas se han clasificado 
en cuatro clases (Meylan et al., 2012; Chowdhary 8 Singh, 2019): 
arquimedeanas, de valores extremos, elípticas y misceláneas. También se 
clasifican en Cópulas de un parámetro o de varios, dependiendo de la 
amplitud o exhaustividad con la cual se define la estructura de la 


dependencia entre las variables Q y V. 
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Salvadori et al. (2007) exponen un resumen amplio y útil de FC que 
han sido aplicadas en el campo de la hidrología. Al respecto, en la relación 
siguiente no se han incluido las familias de Cópulas de Ali-Mikhail-Haq 
debido a que limitan la dependencia a un rango del cociente tau de Kendall 
de -0.1817 a 0.3333, y la familia de Farlie-Gumbel-Morgenstern (FGM) 
que lo limita aún más, al intervalo de +0.2222. 


Las Cópulas arquimedeanas han tenido aplicación amplia debido a su 
construcción simple, un único parámetro, rango amplio y aceptación de 
ambos tipos de dependencia. Haciendo Fx(x) = u, Fíy) = v y 6, el 
parámetro que mide la dependencia o asociación entre u y v, se tienen 
las siguientes dos familias de Cópulas arquimedeanas, las cuales aceptan 
dependencia negativa y positiva (Shiau et al., 2006; Genest € Favre, 
2007; Salvadori et al., 2007; Zhang € Singh, 2019; Chen € Guo, 2019; 
Chowdhary 8: Singh, 2019). 


1. Clayton. Esta Función Cópula es llamada de Cook-Johnson por Zhang 
y Singh (2006). Sraj et al. (2015) la citan con los dos nombres. Su 
ecuación y espacio de variación de O son (Nelsen, 2006): 


(uv) = max ([u“ +v70 — a 0) [-1, 00) 1 £0) (2) 


para 6 = 0, C(u,v) = M(u,v) = uv es la cópula producto que define de 
manera única la independencia. La relación de 6 con el cociente tau de 


Kendall es la siguiente: 
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E (3) 


2. Frank. Su ecuación y espacio de variación de 0 son: 


(tua) 


co) = 51m [14 EA 9 0) (4) 


para 6 = 1, C(u,v) = M(u,v) = uv se define la independencia. La relación 


de 6 con el 7, es la siguiente: 
Tn =1+5[D,(6) — 1] (5) 


siendo Di1(0) la función Debye de orden 1, cuya expresión es: 


t 
et-1 


D,(0) =5 7 dt (6) 


La ecuación anterior se estimó con integración numérica, ratificando 


sus resultados con los valores tabulados por Stegun (1972). 


En seguida se cita una familia de Cópulas de valores extremos, la 


cual acepta solo dependencia positiva. 


3. Gumbel-Hougaard. Su ecuación y espacio de variación de O son: 
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C(u,v) = exp [E Inu)? + In ya [1, 00) (7) 


para 6 = 1, C(u,v) = M(u,v) = uv se define la independencia. La relación 


de 6 con el cociente tau de Kendall es la siguiente: 


8-1 
e E (8) 
Por último, se citan dos familias de Cópulas de clase miscelánea. 


4. Plackett acepta dependencia negativa (0 < 1) y positiva (0 > 1): 


14+(0-1)(u+v) [1+(0-1)Ju+v)]2-4uv0 (0-1) 


Clu,v) = 2(0-1) 2(0-1) 


con0<08<0o,0 +1 (9) 


Para 0 = 1, C(u,v)=M(u,v)=uv se define la independencia. La 


relación de 6 con la rho de Spearman es la siguiente: 


_ (6+1) 28 1n(0) 
n= o) ea» 


(10) 


5. Raftery acepta sólo dependencia positiva, y O varía entre O y 1: 


C(u,v) = min(u, v) + (wen — [max(u, v)]4+9/0-9) (11) 
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para 6 = 0, C(u,v) = M(u,v) = uv se define la independencia. La relación 


de 6 con el cociente tau de Kendall y con la rho de Spearman son las 


siguientes: 
22 
tn 30 
_ 0(4-30) 
n ” Q -ey 


(12) 


(13) 


Familias de Cópulas asociadas 


Las cuatro clases de familias de Cópulas que existen y para el caso 


bivariado tienen tres familias asociadas, definidas por las siguientes 


transformaciones 


estrictamente crecientes o decrecientes, según 


Teorema 2.4.4 en Nelsen (2006). Tales familias son (Salvadori 8 De 
Michele, 2004; Michiels 8 De Schepper, 2008; Chowdhary € Singh, 


2019): 

C'(u,v) =u—C(u,1—v) (14) 
C"(u,v) =v—C(1—u,v) (15) 
Cu, v) =u+v-1+C(1-u 1-0) (16) 


Open Access 
(https://creativecommons.org/licenses/by-nc-sa/4.0/) 
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Las dos primeras transformaciones cambian la naturaleza de las 
medidas de concordancia; es decir, la tau de Kendall y la rho de Spearman 
de negativas a positivas y viceversa. La tercera transformación se 
denomina Cópula de supervivencia (Survival Copula), por estar 
relacionada con la distribución conjunta de las probabilidades de 


excedencia del par de variables aleatorias u y v, cuya Cópula es C. 


Dupuis (2007) destacó la importancia de la Cópula de Clayton 
Asociada por tener dependencia significativa en su cola derecha definida 
por la Ecuación (17) siguiente y cuya fórmula de acuerdo con las 


ecuaciones (2) y (16) es la Ecuación (18): 


Au = PE (17) 


-1/0 


C(u,v) =u+v0-1+[(1-u)%+(1-v) 2-1] (18) 


Medidas de asociación 


Concordancia 


Como la función Cópula (FC) caracteriza la dependencia entre las 
variables aleatorias es necesario el estudio de las medidas de asociación 
para disponer de un método que permita estimar su parámetro 6. En 


términos generales, una variable aleatoria es concordante con otra 
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cuando sus grandes valores están asociados con los grandes valores de 
la otra, y los valores pequeños de una con los valores reducidos de la 
otra. Unas variables con correlación lineal directa serán concordantes, 
pues al aumentar una, la otra también lo hace. Variables con una 
correlación lineal inversa serán discordantes, ya que a grandes valores de 


una le corresponden pequeños valores de la otra. 


Entonces, se dice que (X1, y1) y (Xx2, y2) son concordantes si xi < X2 
Y Y1< y2, O bien, X1 > X2 Y Y1 > y2. Son discordantes si xi < X2 Y Y1 > Y2, 
O bien, X1 > X2 Y Y1< y2. Lo anterior implica que son concordantes (c) las 
parejas (x1-X2) (y1-y2) > O y discordantes (d) cuando (x1-X2) (Y1-Y2) < 
O (Salvadori et al., 2007; Chowdhary €: Singh, 2019). 


Una medida numérica de asociación es un estadístico que indica el 
grado de dependencia o asociación de las variables. Para fines de 
comparación, tales medidas varían de O a +1 o a -1, indicado la 
asociación perfecta positiva en +1 o negativa en -1. El cociente tau de 
Kendall y el coeficiente rho de Spearman son dos medidas no 
paramétricas que proporcionan información sobre una forma especial de 
asociación o dependencia conocida como concordancia (Salvadori et al., 
2007). 


Cociente tau de Kendall 


Mide la probabilidad de tener parejas concordantes, por lo cual es el 
cociente de c - d entre c + d. Su expresión para estimarlo con datos 
bivariados es (Zhang €: Singh, 2006; Zhang € Singh, 2019): 
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dia a Í =1+1 signo]|(x; = xy; — y;)| (19) 


== 1) 


en la ecuación anterior, n es el número de observaciones y el signo [] es 


+1 si tales parejas son concordantes y -1 si son discordantes. 


Genest y Favre (2007) exponen una prueba para el cociente tau, 
aceptando que la hipótesis nula Ho indica que X y Y son independientes y 
entonces el estadístico tiene distribución aproximadamente Normal con 
media cero y varianza 2(2n + 5) / [9n(n - 1)]. Entonces, Ho será 


rechazada con un nivel de confianza a = 5 0% si: 


9n(n-1) 
2(2n+5) 


Itn| > Zajz = 1.96 (20) 


Coeficiente rho de Spearman 


Mide la correlación entre parejas de rangos (R;, Si) de las variables 
aleatorias continuas X; y Y¡. Por ello equivale al coeficiente de correlación 
de Pearson (rxy). Su expresión para estimarlo en un registro bivariado de 
tamaño n es la siguiente (Chowdhary € Singh, 2019; Zhang €: Singh, 
2019): 


a 0. (21) 


Pn = n(n+1)(n-1) n-1 
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Genest y Favre (2007) también presentan una prueba similar para 
el coeficiente rho, cuya distribución se aproxima a la Normal con media 0 


y varianza 1 / (n -— 1), por lo cual se rechaza Ho con un nivel a = 5 % si: 
vn — 1-|p,| > 1.96 (22) 


Estimación del parámetro de dependencia 


El método más simple para estimar el parámetro 6 de las funciones Cópula 
se asemeja al método de momentos y se basa en la inversión de la 
ecuación que relaciona 6 con el cociente tau de Kendall o con el coeficiente 
rho de Spearman. Las otras dos técnicas disponibles se denominan: (1) 
método de máxima pseudo-verosimilitud y (2) método exacto de máxima 
verosimilitud (Meylan et a/., 2012; Chowdhary € Singh, 2019; Zhang € 
Singh, 2019; Chen €: Guo, 2019). En las ecuaciones (5), (10), (12) y (13) 
se procede por tanteos para obtener 0; en cambio, en las fórmulas (3) y 


(8) se despeja su valor. 


Estimación de las probabilidades empíricas 


Las probabilidades empíricas bivariadas se estimaron con base en la 
fórmula de Gringorten (Ecuación (23)), aplicada por Yue et al. (1999), 
Chen y Guo (2019), y Zhang y Singh (2019). Tal fórmula es: 
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$= ¡0.44 (23) 


— n+0.12 


en la cual ¡es el número de cada dato cuando están ordenados de manera 
progresiva, y n es el número total de ellos, o amplitud del registro 
procesado. La expresión anterior se aplicó en el plano bidimensional, con 
los datos ordenados en forma progresiva; los gastos máximos (Q) en los 
renglones y los volúmenes (V) en las columnas. El plano formado es un 
cuadrado de n por n casillas, con n casillas en su diagonal principal, 
cuando el número de orden del renglón es igual al de la columna. 
Después, cada pareja de datos anual (Q y V) se localiza en el plano 
bidimensional, y la casilla definida por la intersección del renglón y 
columna se identifica con el número /, que corresponde al año histórico 
dibujado. 


Cuando las n parejas de datos están dibujadas se busca el año 1 y 
se define un área rectangular o cuadrada de valores menores de Q y de 
V, cuyo conteo de casillas numeradas dentro es NM, o combinaciones de 
Q y V menores. Calculados los n valores de NM; se aplica la fórmula de 
posición gráfica de Gringorten para estimar la probabilidad empírica 


conjunta o bivariada: 


Fy=P0O0<qve<w= M2 (24) 


n+0.12 
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Selección de la función Cópula 


Un enfoque simple de selección de la función Cópula se basa en los 
estadísticos del error de ajuste, al comparar las probabilidades empíricas 
observadas (w?) con las teóricas calculadas (wf) con la función Cópula 
que se prueba. Los indicadores aplicados son el error medio estándar 
(EMB), el error medio absoluto (EMA) y el error absoluto máximo (EAM); 
sus expresiones son (Chowdhary € Singh, 2019; Chen € Guo, 2019): 


EME = A n (we —w£)? (25) 


EMA = Ela l(w? — w£)| (26) 
EAM = maxl(w? — wp)| (27) 
1=1:n 


Dependencia en los extremos de la FC 


Generalidades 


Otro criterio que se aplica para seleccionar una FC es el basado en la 
magnitud de la dependencia en la cola superior de la distribución 
conjunta, lo cual tiene impacto en la veracidad de las predicciones 


extremas. La dependencia en la cola superior derecha (A,) es la 


19 


Tecnología y ciencias del agua, ISSN 2007-2422, 


Open Access bajo la licencia ¡ea! BY-NC-SA 4.0 ES E Nx CAEN) 
(https: //creativecommons.org/licenses/by-nc-sa/4.0/) 152), 01-56: BOI. 10.24850/J-y08-13-02-01. 


a 0) Check for updates 
OPEN ACCESS 


Tecnología y 

CienciaszAgua 
probabilidad condicional de que Y sea mayor que un cierto percentil (s) 
de Fx(y), dado que X es mayor que tal percentil en Fx(x) conforme s se 
aproxima a la unidad. La dependencia en la cola inferior izquierda (A, ) 
compara que Y sea menor que X cuando s se aproxima a 0 (Chowdhary 
8 Singh, 2019). 


En relación con las FC expuestas, las de Frank y Plackett, tienen 
dependencias insignificantes en sus zonas extremas: por ello, A, = 0 y Au 
= 0. Por el contrario, la Cópula Gumbel-Hougaard tiene dependencia 


significativa en la cola superior igual a: 
lp=2-2P (28) 


Las Cópulas de Clayton y Raftery la tienen en su cola inferior e igual 


a: 
A, = gue (29) 
Am=2 (30) 


Como ya se indicó (Ecuación (17)), la Cópula de Clayton asociada 
tiene Ay = 271/8, Familias de Cópulas no expuestas con A, > 0 son las de 
Galambos, Genest-Ghoudi, Húsler-Reiss, Joe y t-Student; esta última de 
la familia elíptica (Salvadori et al., 2007; Chowdhary 8: Singh, 2019; Chen 
8 Guo, 2019). 
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Dupuis (2007) probó seis familias de Cópulas y encontró que su 
capacidad para estimar eventos extremos varía de mala a buena con el 
siguiente orden: Clayton, Frank, Normal, t-Student, Gumbel-Hougaard y 
de Clayton Asociada (Survival Clayton). A conclusiones similares llegan 
Poulin, Huard, Favre y Pugin (2007), al comparar las mismas seis familias 
de Cópulas y la denominada A12, que tiene dependencia significativa en 


su cola derecha. 


Estimación de la dependencia observada 


Para abordar la estimación de la dependencia en la cola superior (Au) que 
muestran los datos disponibles se debe definir primero la llamada Cópula 
Empírica. Como la FC caracteriza la dependencia entre las variables 
aleatorias X y Y, entonces el par de rangos Ri; y S; procedentes de las tales 
variables son el estadístico que retiene la mayor cantidad de información 
y su escalamiento con el factor 1 / (n + 1) genera una serie de puntos en 
el cuadrado unitario (0, 1)?, formando el dominio de la Cópula Empírica 
(Chowdhary 8: Singh, 2019) definida asi: 


Ri Si 
n= < 1) (31) 


1 
C.(u,v) = 3%, 1( 


En la ecuación anterior 1(+*) indica una función de las variables 
aleatorias U y V, que son una transformación en aumento continuo de X 
y Y en relación con las integrales de probabilidad empírica Fn(X) y Fn(YM), 


cuyas ecuaciones son: 


21 


Tecnología y ciencias del agua, ISSN 2007-2422, 


Open Access bajo la licencia ¡ea! BY-NC-SA 4.0 ES E Nx CAEN) 
(https: //creativecommons.org/licenses/by-nc-sa/4.0/) 15(2), 01-56: BOI. 10.24850/J-yc8-13-02-01. 


a 0) Check for updates 
OPEN ACCESS 


Tecnología y 
CienciaszAgua 
Rango (X; Rango (Y; 
0, = YEw = (0) 1, = ED Ev) (32) 


La Ecuación (31) es una función de [0,1]? a (O, 1) que tiene saltos de 
magnitud 1/n en cada pareja de la forma de la Ecuación (32), para i € 
f1,2,--,nj. En realidad, la Ecuación (31) no es una Cópula sino una 


subcópula que sirve para aproximar Cópulas (Nelsen, 2006). 


Poulin et al. (2007) utilizan el estimador propuesto por Frahm, Junker 
y Schmidt (2005), el cual está basado en una muestra aleatoria obtenida 


de la Cópula empírica. Su expresión es: 


1 a a 
rd =2- Z2exp 4 cd In | inzinz,/ Gn! (33) 


Este estimador acepta que la FC se puede aproximar por una de la 
clase de valores extremos y tiene la ventaja de no requerir un valor 


umbral para su estimación. 


Ratificación de la función Cópula seleccionada 


Esta es la etapa más importante del proceso de aplicación práctica de las 
FC, pues en ella se verifica que tal modelo reproduzca fielmente las 
probabilidades conjuntas observadas (Ecuación (24)). Yue (2000) indica 


que la forma simple y práctica de representar las probabilidades conjuntas 
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empíricas y teóricas consiste en llevar al eje de las abscisas la primera y 
al eje de las ordenadas la segunda; lógicamente, en tal gráfica cada 


pareja de datos define un punto que coincide o se aleja de la recta a 45%. 


Yue y Rasmussen (2002) aplican el test de Kolmogorov-Smirnov con 
un nivel de significancia (a) del 5 % para aceptar o rechazar la diferencia 
máxima absoluta (dma) entre las probabilidades conjuntas empíricas y 
teóricas. Para evaluar la estadística (D,) del test se utilizó la expresión 


que exponen Meylan et al. (2012), para a = 5 %, la cual es: 


Da e 1.358 (34) 


n es el número de datos. Si la dma es menor que D, se ratifica la FC 


adoptada. 


Periodos de retorno bivariados 


El primer periodo de retorno bivariado del evento (X, Y) se define bajo la 
condición OR, lo cual indica que los límites x o y, o ambos pueden ser 
excedidos y, entonces, la ecuación clásica del periodo de retorno o inverso 
de la probabilidad de excedencia será (Shiau et al., 2006; Vogel € 
Castellarin, 2017): 


1 1 1 


Try = ———-€ Y —— € Y 35 
XY  P(x>xorY>y)  1-Fxy(6y)  1-C[FXOOFYO)] 2 
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en la cual C[Fx (0), Fy(y)] es la FC seleccionada. 


El segundo periodo de retorno bivariado del evento (X, Y) está 
asociado con el caso en que ambos límites serán excedidos (X > x, Y > 
y) o condición AND. Su ecuación es (Shiau et al., 2006; Vogel € 
Castellarin, 2017): 


Ty = ==> —__—_— (36) 


XY — paoxandY>y)  Fiy(2y)  FxCO-FYOYHCIEXCOFYO)] 


Aldama (2000) obtiene la expresión Fxzy(x,y) de la probabilidad 
bivariada de excedencia mediante un razonamiento de probabilidades 
lógico y simple aplicado en el plano cartesiano. En cambio, Yue y 
Rasmussen (2002) recurren al plano cartesiano para definir el evento 
bivariado (X, Y) conceptualmente, que puede ocurrir en alguno de los 


cuatro cuadrantes. 


La relación entre los periodos de retorno bivariados y los univariados 
es la siguiente (Yue € Rasmussen, 2002; Shiau et a/., 2006; Vogel 8 
Castellarin, 2017): 


Txy < min[Tx, Ty] € max[Tx, Ty] < T'xy (37) 
siendo: 
Tx =x - (38) 


EGO 1=FxG0 
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lo... dl (39) 


Y HO) 1Fy0) 


Eventos críticos o de diseño 


Volpi y Fiori (2012) destacan que la gráfica del periodo de retorno 
conjunto de tipo AND —mostrada como Figura 1— presenta una severa 
inconsistencia al contener, en un contexto bivariado, umbrales críticos 
univariados. Debido a lo anterior, tal gráfica se considera integrada por 
dos porciones, las dos designadas simples (nave part), y la correcta 
(proper part). Las partes rectas son las colas o rectas asíntotas a la parte 
curva. La probabilidad de ocurrencia de un evento o pareja de Q y V es 
variable en la parte curva y decrece a lo largo de la parte recta, aunque 
todos los valores definen el mismo periodo de retorno conjunto. En 
resumen, las parejas de valores de las rectas asíntotas tienen 
probabilidades de ocurrencia bajas y por ello no deben ser incluidas en 
los análisis de búsqueda de las crecientes (Q y V) críticas o severas. Para 
fines prácticos, los puntos extremos de la parte curva se pueden definir 


según su distribución empírica o cercana al inicio de las rectas asíntotas. 
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4.5 


T"(Q V )=10,000 años 


T"(Q ,V )=5,000 años 


T"(Q ,V )=1,000 años 
T"(Q ,V )=500 años 


Volumen anual (10? Mm?) 


0. 1.2.3.4 .5.6 7 8 9 10 
Gasto máximo anual (10? m”/s) 


Figura 1. Gráficas de los cuatro periodos de retorno conjunto Ty, de 
diseño obtenidas con la FC de Gumbel-Hougaard en las crecientes de la 


estación La Cuña, México. 


Test de Wald-Wolfowitz 


Esta prueba no paramétrica ha sido expuesta y aplicada por Bobée y 
Ashkar (1991), Rao y Hamed (2000), y Meylan et al. (2012) para verificar 
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independencia y estacionariedad en registros de gastos máximos anuales 
(X;). Por lo anterior, se propuso aplicar la prueba a los registros de gastos 


máximos y volúmenes anuales, que deben ser muestras aleatorias. 


Selección de las distribuciones marginales 


Ocho distribuciones de probabilidad aplicadas 


El planteamiento de búsqueda de las distribuciones marginales idóneas 
tomó en cuenta las características estadísticas de los datos hidrológicos 
por procesar, gastos máximos y volúmenes de las crecientes anuales. Lo 
anterior, a través de los cocientes L de asimetría (t3) y curtosis (t4), que 
permiten definir en el diagrama de cocientes L de Hosking y Wallis (1997), 
las mejores distribuciones por su menor cercanía a las cinco curvas que 
se muestran en tal gráfico. Dichas distribuciones tienen tres parámetros 
de ajuste: logística generalizada (LOG), general de valores extremos 
(GVE), log-normal (LGN), Pearson tipo III (PE3) y Pareto generalizada 
(PAG). La curva de la PE3 permite probar la distribución log-Pearson tipo 
111 (LP3). 


Además, se aplicaron dos modelos probabilísticos que han mostrado 
gran versatilidad y universalidad para representar series de datos 
hidrológicos extremos debido a que tienen 4 y 5 parámetros de ajuste. 


Tales distribuciones son la Kappa (Hosking, 1994; Kjeldsen, Ahn, 4 
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Prosdocimi, 2017; Campos-Aranda, 2023) y la Wakeby (Hosking 8 Wallis, 
1997). 


La distribución LP3 fue la única que se aplicó con el método de 
momentos en los dominios logarítmico (WRC, 1977) y real (Bobée, 1975), 
seleccionando la de mejor ajuste. Las siete restantes se ajustaron a los 
registros de gasto máximo y volumen anual de crecientes a través del 
método de momentos L, según procedimientos expuestos por Hosking y 
Wallis (1997). 


Momentos L de la muestra 


Los momentos L son combinaciones lineales de los momentos de 
probabilidad ponderada (b,), definidos por Greenwood, Landwehr, Matalas 
y Wallis (1979); por lo anterior, son robustos ante los valores dispersos 
de muestra. Su cálculo comienza por ordenar las series disponibles de 
gastos máximos (x;) y volúmenes anuales (y;) de las crecientes de menor 
a mayor (x, <x,<-»" <x,), y estimar los b- con la ecuación siguiente 
(Hosking € Wallis, 1997; Rao € Hamed, 2000; Asquith, 2011; Stedinger, 
2017): 


b, 2% 1 n (¡i-1)(-2)-«(i—r) (40) 


En la expresión anterior el número de orden r varía de O a 3 y nes 


el número de datos de las series anuales. Se deduce que bo es igual a la 


28 


Tecnología y ciencias del agua, ISSN 2007-2422, 


Open Access bajo la licencia ¡ea! BY-NC-SA 4.0 ES E Nx CAEN) 
(https: //creativecommons.org/licenses/by-nc-sa/4.0/) 152), 01-56: BOI. 10.24850/J5yc8-13-02-01 


ei Que: 0) Check for updates 
Tecnología y 
CienciaszAgua 
media aritmética. Los momentos L de la muestra (/) y sus respectivos 
cocientes (t) de similitud con los coeficientes de variación, asimetría y 


curtosis son: 


L, = Do (41) 
l, =2-*b,—bo (42) 
la=6-b,-6-b, +bo (43) 
Ll, =20-b3—30-b,+ 12: b, —bo (44) 
ty =1,/L, (45) 
tz =l3/l (46) 
t, =L,JL (47) 


Diagrama de cocientes de momentos L 
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Tiene en el eje de las abscisas a t3 y en el de las ordenadas a t4. Las FDP 
de tres parámetros de ajuste son líneas curvas con las ecuaciones de tipo 


polinomio siguientes (Hosking € Wallis, 1997): 
Logística generalizada (LOG): 

£F96 = 0,16667 + 0.83333 - t? (48) 
Pareto generalizada (PAG): 

¿PAS = 0,20196 : tz + 0.95924 - t2 — 0.20096 - t3 + 0.04061 - tó (49) 
Log-normal (LGN): 

¿FON = 0,12282 + 0.77518 : t2 + 0.12279 -tÍ — 0.13638 : t£ + 0.11368 - t£ (50) 
Pearson tipo III (PT3): 

EP13 = 0,12240 + 0.30115 : t2 + 0.95812 - td — 0.57488 - t$ + 0.19383 : t$ (51) 


General de valores extremos (GVE): 
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E£VE = 0.10701 + 0.11090 : tz + 0.84838 - t? — 0.06669 - th + SF (52) 


siendo SF = 0.00567 - t* — 0.04208 -t5 + 0.03763 - t£ 


Utilizando los logaritmos naturales de los datos en las ecuaciones 
(40) a (47) se obtienen los cocientes L logarítmicos y entonces se puede 


utilizar la Ecuación (51) para valorar a la distribución log-Pearson tipo III. 


Distancia absoluta 


Uno de los enfoques recientes para la selección de la mejor FDP de una 
serie de datos consiste en llevar al diagrama de cocientes L los valores de 
la muestra (tz y t4) y definir su cercanía a alguna de las curvas para 
obtener el mejor modelo probabilístico. Para evitar la subjetividad en la 
selección de la FDP se ha propuesto evaluar la distancia absoluta (DA) 


con la expresión siguiente (Yue 8 Hashino, 2007): 
DA = ta (6325) — £2P5 (53) 


donde +3?* y t2?* son los cocientes L de asimetría y curtosis de la serie 
analizada, y t,(t£?*) es el valor teórico del cociente L de curtosis calculado 
con cada FDP (ecuaciones (48) a (52)), para el valor observado del 
cociente L de asimetría. Una FDP con el menor valor de la DA es la mejor 


para los datos procesados. 
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Errores de ajuste 


El primer criterio aplicado para la selección de la mejor FDP a unos datos 
o serie disponible fue el llamado error de ajuste (Kite, 1977; Willmott 8 
Matsuura, 2005; Chai € Draxler, 2014). Este criterio será aplicado 
después de seleccionar las tres mejores FDP en el diagrama de cocientes 
L de acuerdo con su distancia absoluta mínima, y de haber aplicado las 


distribuciones Kappa y Wakeby. 


Cambiando en las ecuaciones (25) y (26) las probabilidades 
observadas por los datos ordenados de la serie analizada (x; O y;), y las 
probabilidades calculadas por los valores estimados con la FDP que se 
prueba o contrasta, se obtienen el error estándar de ajuste (EEA) y el 
error absoluto medio (E£AM). Los valores que se estiman (%; o ),) se buscan 
para la misma probabilidad de no excedencia, asignada a los datos por la 


fórmula empírica de Gringorten (Ecuación (23)). 


Datos por procesar 


La hidrométrica La Cuña con clave 12054 y área de cuenca de 19 097 
km?, se ubica en el Río Verde de la Región Hidrológica No. 12-3 (río 
Santiago), México. Gómez et al. (2010) exponen el registro de gasto 
máximo en m3/s y volúmenes anuales en millones de m3 (Mm) del 
periodo de 1947 a 2004, con 55 parejas de datos (n), ya que los años 
1983, 1984 y 1985 no tienen información de volúmenes. Tales datos se 


exponen en la Tabla 1. 
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Tabla 1. Gastos máximos, volúmenes y sus números de orden 
bivariados de las crecientes anuales de la estación de aforos La Cuña, 
México (Gómez et al., 2010). 


Año Q (m?/s) V (Mm) NM; Año Q (m?/s) V(Mm3) | NM; 
1947 784.0 146.80 36 1975 622.1 249.07 40 
1948 736.8 155.12 37 1976 1 374.0 527.96 52 
1949 510.0 111.40 28 1977 439.7 111.77 28 
1950 461.0 94.06 24 1978 280.2 66.23 15 
1951 411.0 111.55 27 1979 267.2 45.80 9 
1952 326.0 70.82 19 1980 287.3 99.60 20 
1953 349.8 144,75 28 1981 280.7 28.70 5 
1954 130.4 23.22 3 1982 156.5 35.37 

1955 690.0 203.31 39 1986 698.2 193.51 38 
1956 266.0 106.76 17 1987 184.7 55.39 7 
1957 199.0 45.92 9 1988 595.2 242.21 38 
1958 690.0 188.71 37 1989 110.2 42,49 3 
1959 340.6 47.91 12 1990 523.9 248.07 37 
1960 249.6 91.58 14 1991 1636.3 443.30 52 
1961 350.0 130.68 28 1992 1168.0 172.49 40 
1962 317.0 51.27 12 1993 295.0 96.50 20 
1963 732.6 127.90 33 1994 212.8 53.55 10 
1964 265.1 82.75 15 1995 367.4 114.61 27 
1965 743.6 295.34 46 1996 144.6 57.43 5 
1966 463.9 202.90 35 1997 78.4 16.55 1 
1967 1 474.9 598.38 53 1998 261.9 66.17 13 
1968 323.0 118.25 25 1999 196.3 41.15 7 
1969 160.4 32.22 4 2000 46.8 18.62 

1970 763.8 187.75 39 2001 313.8 75.78 18 

| 1971 | 5780 | 166.61 | 36 | 2002 | 3196 | 153.79 | 25 | 
1972 191.8 26.39 4 2003 621.1 326.28 40 
1973 2 440.0 920.30 55 2004 824.5 384.45 50 
[| 1974 | 2384 | 66.66 | 13 | Med | 340.6 | 11140 | - | 
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Resultados y su discusión 


Búsqueda de las distribuciones marginales 
Verificación de la aleatoriedad 


Primero se verificó la aleatoriedad de los registros por procesar con base 
en el Test de Wald-Wolfowitz, cuyo estadístico condujo a valores de 0.284 


y 0.213 para los gastos y volúmenes de la Tabla 1. 


Distancias absolutas calculadas 


En la Tabla 2 se han concentrado los resultados de las ecuaciones (48) a 
(52), destacando las tres mejores FDP de cada registro de datos de la 


Tabla 1. 


Tabla 2. Números de orden de la mejor FDP para los registros indicados 
de la estación hidrométrica La Cuña, México, según distancia absoluta 


en el diagrama de cocientes L (Hosking € Wallis, 1997). 


Gastos máximos anuales (m/s) Volúmenes anuales (Mm) 

tz = 0.38713 In 3 = 0.01249 t3 = 0.43326 In t3 = 0.01382 

ta = 0.25523 In ta = 0.15953 ta = 0.28466 In ta = 0.12466 
Distribución LOG 0.0363 (3) Distribución LOG 0.0384 (5) 
Distribución GVE 0.0179 (2) Distribución GVE 0.0240 (3) 
Distribución LGN 0.0139 (1) Distribución LGN 0.0128 (2) 
Distribución PT3 0.0680 (6) Distribución PT3 0.0755 (6) 
Distribución PAG 0.0440 (5) Distribución PAG 0.0320 (4) 
Distribución LP3 0.0371 (4) Distribución LP3 0.0022 (1) 
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Distribución de los gastos máximos anuales 


En la Tabla 3 se exponen los errores de ajuste y predicciones (m/s) 


obtenidas con las tres mejores distribuciones, y la Kappa y Wakeby 


aplicadas al registro de gastos máximos de la Tabla 1. Se observa que las 


dos mejores distribuciones, la LGN y la GVE, reportan los errores de ajuste 


más bajos y similares, pero sus predicciones son bastante diferentes en 


los cuatro periodos de retorno elevados. Por otra parte, los errores de 


ajuste de la distribución Kappa son casi idénticos a los de la LGN, pero 


con predicciones intermedias, y por ello fue la adoptada. 


Tabla 3. Errores de ajuste y predicciones (m3/s) de las tres mejores 


FDP, la Wakeby y la Kappa en el registro de gastos máximos anuales de 


la estación hidrométrica La Cuña, México. 


Periodos de retorno en años 

FDP EEA (m3/s) | EAM (m/s) 
50 100 500 ¡1000 | 5000 | 10 000 
LOG (3) 61.3 39.4 1816 | 2393 | 4504 | 5902 | 11036 | 14 441 
GVE (2) 55.7 35.8 1838 | 2372 |4160| 5254 | 8926 11 172 
LGN (1) 55.8 36.5 1839 | 2293 | 3592 | 4270 | 6167 7 139 
KAPPA 55.7 36.7 1835 | 2335 |3920 | 4844 | 7 784 9 489 
WAKEBY 35.2 55.7 1844 | 2304 | 3646 | 4 367 6 469 7 599 
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Los parámetros de ubicación (u:), escala (a1) y forma (k1 y h1) de 
la distribución Kappa seleccionada son 258.7462, 228.381, -0.2685394 y 
0.2888472, respectivamente, cuya expresión es: 


y 1/1 
FO) =(1=h, [1 -220]%) (54) 


Distribución de los volúmenes anuales 


En la Tabla 4 —similar a la anterior para los volúmenes anuales de la 
Tabla 1— se observa que la mejor distribución, la LP3, conduce a los 
errores de ajuste más bajos, pero sus predicciones son bastante menores 
que las de la GVE. En cambio, la distribución Kappa conduce a errores de 
ajuste bajos y sus predicciones son intermedias, por ello fue adoptada. 


En este caso, la distribución Wakeby ratifica la selección. 


Tabla 4. Errores de ajuste y predicciones (Mm3) de las tres mejores 
FDP, la Wakeby y la Kappa en el registro de volúmenes anuales de la 


estación hidrométrica La Cuña, México. 


ED EEA (Mm*) | EAM (Mm:) Periodos de retorno en años 
50 100 500 1000 | 5000 |i0 000 
GVE (3) 16.6 9.0 662 888 1702 [2234 | 4156 5 411 
LGN (2) 14.5 7.6 670 863 1439 |1752| 2661 3 142 
LP3 (1) 10.5 6.3 694 907 1574 |1952 | 3101 3 736 
KAPPA 15.5 8.1 663 873 1576 | 2007 | 3459 4 350 
WAKEBY 15.7 8.3 664 872 1561 |1978 | 3358 4 193 
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Los parámetros de ubicación (uz), escala (a2) y forma (k2 y h2) de 
la distribución Kappa adoptada son 60.39858, 78.31082, -0.3155518 y 


0.4287021, respectivamente, cuya expresión es: 


a 1H y 
F(y) =(1 ho [1 - 2022] > (55) 


Selección y ratificación de la función Cópula 


El procesamiento bivariado de los datos de la Tabla 1 condujo a los 
siguientes tres indicadores de asociación: rxy = 0.9302, 1, = 0.7199 y Pn 
= 0.9088. La Ecuación (20), con n = 55 y el tau citado, origina un valor 
de 7.76; por lo cual, el cociente de Kendall es significativo. La Ecuación 
(22) genera un valor de 6.68 y entonces el coeficiente de Spearman 
también es significativo. La Ecuación (33) aporta un valor para la 


dependencia observada en la cola derecha de 1fF“ = 0.782. 


Por otra parte, en la Tabla 5 se muestran los indicadores estadísticos 
de ajuste que se obtuvieron al aplicar las seis FC expuestas de Clayton, 
Frank, Gumbel-Hougaard (GH), Plackett, Raftery y Clayton asociada. En 
las ecuaciones (25) a (27), las probabilidades bivariadas empíricas se 


estimaron con la Ecuación (24), y las teóricas con las ecuaciones (2), (4), 
7), (9), (11) y (18). 
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Tabla 5. Indicadores estadísticos del ajuste de las funciones Cópula 


indicadas en las crecientes anuales de la estación hidrométrica La Cuña, 


México. 
Cópula 0 EME | EAM dd ed MDP MDN de 
DP | DN 

Clayton (C.) | 5.1394 | 0.0245 | 0.0189 | 28 | 27 | 0.0714 | -0.0424 | 0.000 
Frank 12.386 | 0.0227 | 0.0169 | 29 | 26 | 0.0581 | -0.0561 | 0.000 
GH 3.5697 | 0.0255 | 0.0192 | 28 | 27 | 0.0541 | -0.0676 | 0.786 
Plackett 75.040 | 0.0247 | 0.0187 | 23 | 32 | 0.0495 | -0.0647 | 0.000 
Raftery 0.7940 | 0.0250 | 0.0193 | 27 | 28 | 0.0746 | -0.0457 | 0.000 
C. asociada | 5.1394 | 0.0288 | 0.0225 | 29 | 26 | 0.0477 | -0.0788 | 0.874 


Significado de los nuevos acrónimos: 
DP, DN: diferencias positivas y negativas. 


MDP, MDN: máxima diferencia positiva y negativa. 


Como los valores de Q y V de las crecientes anuales registradas en 
la estación hidrométrica La Cuña muestran una magnitud de A£F“ de 0.782 
para la dependencia observada en su cola derecha, no existe dificultad 
para seleccionar como mejor FC la de Gumbel-Hougaard para los datos 
de la Tabla 1 debido a que reporta un valor para la dependencia 
significativa en su extremo derecho, prácticamente igual al observado o 


mostrado por los datos. 


Cuando el valor de AF“ resulte bastante inferior al de la FC de 
Gumbel-Hougaard, se puede recurrir a aplicar la FC de clase elíptica 


llamada de t-Student, la cual —de acuerdo con los resultados de Dupuis 
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(2007) y de Poulin et a/. (2007)— tiene una dependencia igual en ambas 


colas, pero de menor valor. 


En la Tabla 5 los indicadores estadísticos más bajos del EME y EAM, 
y las diferencias máximas entre las probabilidades bivariadas se han 
mostrado en cursivas. Se observa que la FC adoptada de Gumbel- 
Hougaard tiene indicadores de ajuste ubicados entre los más reducidos 
obtenidos con la FC de Frank y los más grandes generados por la FC de 


Clayton asociada. 


En la Tabla 6, Tabla 7 y Tabla 8 se muestra una parte de las 
probabilidades de no excedencia bivariadas, empíricas observadas (w/) y 
teóricas calculadas (wf) con la FC de Frank, de Gumbel-Hougaard y de 
Clayton asociada. También se indican sombreadas las diferencias 


máximas positiva y negativa. 


Tabla 6. Probabilidades de no excedencia conjuntas y sus diferencias 


para una parte de las crecientes de la estación La Cuña, México, con la 


FC de Frank. 

No. wi w;¡ Diferencias | No. wi wi Diferencias 

1 0.6451 | 0.6477 -0.0026 30 0.9354 | 0.9344 0.0011 

5 0.4819 | 0.4872 -0.0053 35 0.0827 | 0.0783 0.0044 
10 0.3004 | 0.3139 -0.0134 40 0.0464 | 0.0375 0.0089 
112 0.6633 | 0.7194 -0.0561 45 0.1734 | 0.1704 0.0226 
20 0.6270 | 0.6096 0.0174 50 0.1190 | 0.1169 0.0021 
25 0.6451 | 0.6609 -0.0157 55 0.8991 | 0.8410 0.0581 


39 


Tecnología y ciencias del agua, ISSN 2007-2422, 


Open Access bajo la licencia [ee BY-NC-SA 4.0 15(2), 01-56. DOI: 10.24850/j-tyca-15-02-01 


(https: //creativecommons.org/licenses/by-nc-sa/4.0/) 


Tecnología y 


CienciaszAgua 


OPEN Que: 


0) Check for updates 


Tabla 7. Probabilidades de no excedencia conjuntas y sus diferencias 


para una parte de las crecientes de la estación La Cuña, México, con la 
FC de Gumbel-Hougaard. 


No. wi w;¡ Diferencias No. wi w;¡ Diferencias 
dl 0.6451 | 0.6512 -0.0061 30 0.9354 | 0.9520 -0.0166 
5 0.4819 | 0.4765 0.0053 35 0.0827 | 0.0777 0.0050 
dia 016683 11027309 -0.0676 40 0.0464 | 0.0401 0.0063 
15 0.5000 | 0,4459 0.0541 45 0.1734 | 0.1624 0.0111 
20 0.6270 | 0.6116 0.0154 50 0.1190 | 0.1143 0.0048 
25 0.6451 | 0.6661 -0.0210 55 0.8991 | 0.8557 0.0435 


Tabla 8. Probabilidades de no excedencia conjuntas y sus diferencias 


para una parte de las crecientes de la estación La Cuña, México, con la 


FC de Clayton asociada. 


No. 


Diferencias 


wi wi No. wi wi Diferencias 
1 0.6451 | 0.6540 -0.0088 30 0.9354 0.9548 -0.0194 
5 0.4819 | 0.4863 0,0044 35 0.0827 0.0727 0.0100 
pez 0.6633 | 0.7421 -0.0788 40 0.0464 0.0286 0.0178 
15 0.5000 | 0.4523 0.0477 45 0.1734 0.1454 0.0280 
20 0.6270 | 0.6170 0.0100 50 0.1190 0.0944 0.0246 
25 0.6451 | 0.6798 -0.0346 55 0.8991 0.8578 0.0414 
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Por otra parte, la Ecuación (34) define a D, = 0.1831, y como las 
diferencias máximas absolutas de la Tabla 6, Tabla 7 y Tabla 8 son 
0.0581, 0.0676 y 0.0788, el test de Kolmogorov-Smirnov ratifica las tres 
FC contrastadas. Los coeficientes de correlación (rxy) entre las 55 
probabilidades empíricas y las teóricas —estimadas con las FC de Frank, 
Gumbel-Hougaard y Clayton asociada— son los siguientes: 0.9968, 
0.9964 y 0.9962; por lo tanto, se corresponden, en orden de magnitud, 


con las diferencias máximas observadas. 


El contraste gráfico entre ambas probabilidades, para ratificar la 
adopción de la FC de Gumbel-Hougaard, se expone en la Figura 2 para 


los datos completos de la Tabla 7. 
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Probabilidad de no excedencia empírica 
Figura 2. Contraste gráfico de probabilidades conjuntas del gasto pico y 


volúmenes de las crecientes de la estación La Cuña, México, con la FC 


de Gumbel-Hougaard. 
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Gráficas del periodo de retorno bivariado Ty, 


Considerando que en el cauce y cerca del sitio de la estación de aforos La 
Cuña se va a construir un embalse que de acuerdo con la capacidad que 
se le asigne puede ser pequeño, mediano o grande, entonces se requieren 
los periodos de retorno bivariados de tipo AND de 500, 1 000, 5 000 y 10 
000 años (Campos-Aranda, 2008). Tales magnitudes se estiman con la 
Ecuación (36). Para ello, de manera arbitraria se seleccionan volúmenes 
y gastos pico, a fin de obtener sus probabilidades de no excedencia 
marginales (ecuaciones (54) y (55)) y conjunta (Ecuación (7)) con la FC 
de Gumbel-Hougaard. En la Tabla 9 se muestran resultados para definir 


las cuatro gráficas de la Figura 1. 
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Tabla 9. Parejas de gasto máximo y volumen anual utilizadas para 


definir las gráficas del periodo de retorno conjunto tipo AND con la FC de 


Gumbel-Hougaard, en las crecientes de la estación hidrométrica La 


Cuña, México. 


Te o To a 

500 años 1 000 años 5 000 años 10 000 años 

Y Q Y Q V Q V Q 
Mm m3/s Mm m3/s Mm3 m3/s Mm m3/s 
0 3 920 0 4 844 0 7 784 0 9 489 
500 3 919 500 4 843 1 000 7 782 1 500 9 489 
750 3 918 1 000 4 841 1 500 7 782 2 500 9 485 
1 000 3 906 1 250 4 830 2 000 TIPS 2 600 9 480 
11 00 3 892 1 400 4 813 2 200 7 763 2 700 9 478 
12 50 3 847 1500 4 791 2 400 7 742 2 800 9 469 
13 00 3 818 1 550 4 776 2 500 7727 2 900 9 459 
1 400 3 720 1 600 4 756 2 600 7 705 3 000 9 449 
1 450 3 630 1 650 4 729 2 700 7 678 3 100 9 436 
1 500 3 475 1 700 4 695 2 800 7 638 3 200 9 421 
1 525 3 342 1 750 4 649 2 900 7 585 3 300 9 400 
1 540 3222 1 800 4 586 3 000 75811 3 400 9 370 
1 550 3 108 1 850 4 495 3 100 7 405 3 500 9 335 
1 560 2 938 1875 4 433 3 200 7241 3 600 9 290 
1565 2 809 1 900 4 355 3 300 6 963 3 700 9 232 
1 570 2 604 1925 4 252 3.325 6 860 3 800 9 148 
11575 2 039 1 950 4 104 3 350 6.731 3 900 9 049 
1576 0 1975 3 862 3 375 6 566 4 000 8 898 
2 000 3 244 3 400 6 340 4 050 8 800 
2 007 0 3 425 5 981 4 100 8 674 
3 450 5 183 4 150 8 515 
3 459 0 4 200 8 306 
4 250 7996 
4 300 7 482 
4 325 6 935 
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Contraste de los periodos de retorno bivariados 


En la Tabla 10 se muestran los cálculos realizados para llevar a cabo la 
verificación de la Ecuación (37). Se observa y comprueba que en todos 
los casos el Txy es menor de los periodos de retorno univariados (7) y por 


el contrario el Tyy siempre es mayor. 


Tabla 10. Periodos de retorno univariados y bivariados estimados con la 
FC de Gumbel-Hougaard en las crecientes de la estación hidrométrica La 


Cuña, México. 


T= Tx= Ty Qr vr CIFXO,Fr(y)1 Txy Txy 
50 1835 663 0.9757031 41.2 63.3 
100 2 335 873 0.9878718 82.5 127.1 
500 3 920 1576 0.9975724 411.9 636.3 
1 000 4 844 2 007 0.9987859 823.7 1 272.5 
5 000 7 783 3 459 0.9997571 4 116.9 6 364.6 
10 000 9 489 4 350 0.9998783 8 216.9 | 12 700.4 


Selección de los eventos de diseño 


En la Figura 1 o en la Tabla 9 se pueden seleccionar infinitas parejas de 
Q y V que satisfacen el periodo de retorno conjunto de diseño y que se 


definen como subgrupo de parejas críticas por estar dentro de la porción 
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curva de cada gráfica del 7;, fuera de las rectas asíntotas (Volpi 8: Fiori, 
2012). 


Las combinaciones de gasto pico y volumen que tienen el mismo 
periodo de retorno bivariado de diseño establecen crecientes oO 
hidrogramas que producirán diferentes efectos en el embalse que se 
diseña o revisa; se adopta por seguridad el que genera las condiciones 
más críticas o severas. Para formar cada hidrograma de diseño existen 
métodos teóricos y empíricos (Aldama, 2000; Aldama et al., 2006; 
Campos-Aranda, 2008; Xiao, Guo, Liu, 8 Fang, 2008; Gómez et al., 2010; 
Gráler et al., 2013). 


Contraste con resultados de la GVE bivariada 


Campos-Aranda (2022) procesó los registros de la Tabla 1 con base en la 
distribución GVE bivariada, ajustada por medio de máxima verosimilitud; 
por lo cual, sus funciones marginales son de tipo GVE y sus parámetros 
de ajuste se involucran en el mejor ajuste logrado. En la Tabla 11, en los 
renglones 1 y 2, se muestran las predicciones univariadas conjuntas que 


se obtuvieron. 
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Tabla 11. Predicciones obtenidas con las distribuciones GVE bivariada y 
Kappa como marginales de las crecientes anuales de la estación 


hidrométrica La Cuña, México. 


Periodos de retorno univariados en años 
Renglón | Reg. FDP 
50 100 500 | 1000 5000 | 10000 
pl Q GVEb 1550 | 1958 | 3254 4009 6 418 7 823 
2 V GVEb 568 739 1317 | 1673 2 877 3 619 
3 Q Kappa | 1835 | 2335 |3920| 4844 7 784 9 489 
4 V Kappa 663 873 1576 | 2007 3 459 4 350 


Por otra parte, en los renglones 3 y 4 de la Tabla 11 se tienen las 
predicciones adoptadas en la Tabla 3 y Tabla 4 anteriores. Para los 
periodos de retorno indicados se observa que todas las nuevas parejas de 
predicciones de Q y V son mayores, lo anterior repercute en la definición 
de las parejas críticas en la Figura 1, que ahora son más grandes, en 


comparación con las obtenidas al aplicar la distribución GVE bivariada. 


Conclusiones 


La ventaja fundamental de usar las funciones Cópula (FC) en el análisis 
de frecuencias de crecientes bivariado consiste en poder construir 
fácilmente la distribución de probabilidades conjunta con base en unas 
distribuciones univariadas marginales iguales o diferentes, incluso de 
poblaciones mezcladas, previa estimación de la dependencia entre las 
variables aleatorias gasto máximo (Q) y volumen (V) de las crecientes 


anuales. 
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El enfoque práctico de aplicación de las FC requiere de una 
minuciosa selección de las distribuciones marginales y por ello se empleó 
el diagrama de cocientes L, para buscar las tres mejores distribuciones de 
probabilidad y luego contrastarlas con base en sus errores de ajuste y 
magnitud de sus predicciones, y así adoptar las más representativas para 
los registros de Q y V disponibles. En tal contraste se incluyeron dos 
distribuciones de gran versatilidad, por tener 4 y 5 parámetros de ajuste: 


los modelos Kappa y Wakeby. 


Este enfoque práctico de aplicación de las FC utiliza Cópulas de un 
solo parámetro de ajuste (0), que se estima a partir del cociente tau de 
Kendall o del coeficiente rho de Spearman, que se calculan con el registro 
conjunto de Q y V. Tal enfoque primero estima a A“ o dependencia 
observada en la cola derecha del registro disponible. Después se busca 
una FC que reproduzca tal valor de 15“. También se aplican FC que no 
tienen dependencia significativa en su cola derecha, como las de Clayton, 
Frank, Plackett y Raftery, para poder comparar y juzgar la calidad del 


ajuste de la FC adoptada previamente. 


La aplicación numérica descrita en los 55 datos anuales de Q y V de 
las crecientes registradas en la estación hidrométrica La Cuña de la Región 
Hidrológica No. 12-3 de México mostró una reproducción fidedigna de las 
probabilidades bivariadas empíricas y teóricas a través de la FC de 
Gumbel-Hougaard, con un coeficiente de correlación lineal de 0.9964. Por 
otra parte, en la Figura 1, relativa a los periodos de retorno conjuntos de 
diseño de tipo AND, se pueden definir infinitas parejas de Q y V críticas, 


por estar en la región curva de cada gráfica. 
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